Loading [MathJax]/jax/output/HTML-CSS/jax.js

ベイズの定理

木 26 7月 2018

ベイズの定理の導出から, モンティ・ホール問題への応用まで.

ベイズの定理の導出

事象 A が発生する確率を「P(A)=A が発生する確率 ÷ すべての事象の数」と書くとき, ベイズの定理は

事象 B のもとで事象 A が発生する確率 P(AB)=P(BA)P(A)P(B) (P(B)>0)

と定義される. 以下ベイズの定理を導出する. 例として, 起こり得る全ての事象の数を 200, 事象 A, 事象 B(以下単に A, B と書く)が発生した回数をそれぞれ 60, 40 とし, A および B が発生した確率を 10 とする. 簡単のために, この事象関係を表すベン図を次に示す1.

ある事象を表したベン図

まず, A および B が発生する確率 P(AB)=P(BA) を求める. A, B がそれぞれ発生する確率は,

P(A)=60200=310 P(B)=40200=15

である2. B の下で A が発生する確率と, A の下で B が発生する確率は,

P(AB)=1040=14 P(BA)=1060=16

である. そもそも, B が発生しなければ, A および B が発生するということはないし, A が発生しなければ, B および A が発生するということはないので,

P(AB)=P(AB)P(B)=1415=120 P(BA)=P(BA)P(A)=16310=120

である. あとは変形すれば良いだけで,

P(AB)P(B)=P(AB) P(AB)=P(AB)P(B) P(AB)=P(BA)P(A)P(B)

モンティ・ホール問題

確率論的な話となるとよく挙げられる有名な問題, モンティ・ホール問題をベイズの定理で解く. モンティ・ホール問題は,

(snip)プレーヤーの前に閉まった3つのドアがあって、1つのドアの後ろには景品の新車が、2つのドアの後ろには、はずれを意味するヤギがいる。プレーヤーは新車のドアを当てると新車がもらえる。プレーヤーが1つのドアを選択した後、司会のモンティが残りのドアのうちヤギがいるドアを開けてヤギを見せる。 ここでプレーヤーは、最初に選んだドアを、残っている開けられていないドアに変更してもよいと言われる。プレーヤーはドアを変更すべきだろうか?(snip)
ゲームのルール:
  1. 3つのドア (A, B, C) に(景品、ヤギ、ヤギ)がランダムに入っている。
  2. プレーヤーはドアを1つ選ぶ。
  3. モンティは残りのドアのうち1つを必ず開ける。
  4. モンティの開けるドアは、必ずヤギの入っているドアである。
  5. モンティはプレーヤーにドアを選びなおしてよいと必ず言う。
モンティ・ホール問題 - wikipedia

いま, この問題をモンティがヤギのドアを開けた後に, プレーヤーが景品のドアを開ける条件付き確率問題とし, プレーヤーが初手で A を選択, それに対しモンティが B を選択したとする3. モンティが B を選択したということは, 景品のドアは A または C である. すなわち, プレーヤーが A を選択し, この選択を変えずに A が景品のドアである確率は P(AB), 選択を変え C が景品のドアである確率は P(CB) と書ける. このそれぞれの条件付き確率を, 上で導出したベイズの定理の式に当てはめて求めればよい4.

  • モンティは, プレーヤーが選択した 2 つのドア以外のどちらかを選択するから, P(B)=12 である.
  • プレーヤーが初手で選ぶ段階では, 景品のドアを選ぶ確率は均等であるから, P(A)=P(C)=13 である.

これらを基に, まず P(AB) について式にすると,

P(AB)=P(BA)P(A)P(B)=121312=13

P(AB) とは先も述べたように, A が景品のドアであると踏んだときに, それが景品のドアである確率である. よって,

  • A が景品のドアであれば, モンティは BC どちらを選択しても良いことになるので, P(BA)=12 である.

から上式のようになる. 次に, P(CB) について式にすると,

P(CB)=P(BC)P(C)P(B)=11312=23

P(CB) とは先も述べたように, C が景品のドアであると踏んだときに, それが景品のドアである確率である. よって,

  • C が景品のドアであれば, モンティは B しか選ぶことができないから, P(BC)=1 である.

から上式のようになる. よって, ドアの選択を変えるべきであるという解が導かれる. Wikipedia にも似たような図があるが, 折角なので, 1000 回モンティ・ホール問題を試行した場合において, 選択を変えて景品のドアを当てた回数と, 選択を変えずに景品のドアを当てた回数をプロットしてみた5.

モンティ・ホール問題の視覚化図

当たり前ではあるのだが, この図からも, C に変えた方が当たる回数が多くなっていることを確認できる.


  1. 図は matplotlib_venn 他で生成

  2. 自明であるが, これを P(A)=P(AΩ),P(B)=P(BΩ) と書くこともできる. 

  3. 他のどのようなドアの組み合わせをとっても, プレーヤーが 1 つドアを選択し, モンティが 1 つヤギのドアを選択するという規則には影響しないから, この前提による一般性の欠如を懸念する必要はない. 

  4. 注: 一応述べておくと, ベイズの定理で使われている変数 A,B,C は, このドア A,B,C とは無関係である. 

  5. 図は matplotlib で生成